新品发布|SynEcoSys单细胞数据库亮相“第十一届江苏省生物信息学学术会议”
SynEcoSys标准数据集
数据集可比性高
从数据集到临床知识库
现阶段,现有公共和商业单细胞数据库的一大共同痛点是收录的样本缺乏对应的临床信息,使得数据利用停留在科研探索的范围之内,难以有效转向临床应用。新格元在SynEcoSys®数据库中同时收录的细胞数据对应的临床信息,每个样本带有对应的临床病理和病人治疗信息,建立起单细胞数据集与临床转化之间的桥梁。
单细胞肿瘤核心数据集(Core datasets)
新格元生信与数据中心团队重点整理了肺癌、胃癌、肝癌、肾癌和肠道癌五大热门癌种的核心数据集。对于每个癌种,全面收录不同分期、分型、治疗手段、治疗反应等临床数据。对于多来源数据进行批次处理和整合分析,并统一注释层级和命名规则。Core datasets针对性地解决单细胞数据挖掘痛点问题,即,整合了肿瘤单细胞数据集的异质性。直接比较多个研究来源的数据,精细刻画肿瘤微环境中免疫细胞亚型在不同临床病人中的比例和功能状态差异。
CeleViz数据可视化平台
引领我们探索的是单细胞测序海量数据,打开缤纷单细胞世界的是可视化艺术。SynEcoSys®内置CeleViz数据可视化平台,可自由按照细胞类型、样本分组等临床信息选择不同色系可视化细胞图谱、热图与小提琴图等。可直观可视化细胞或基因在单细胞数据中的表现。
可视化艺术离不开灵活的统计框架。CeleViz数据可视化平台支持细胞类型在不同样本和不同样本分组中的占比情况统计作图。同时支持任意两个细胞群体间差异基因与通路富集分析,清晰展示分析对象间在通路功能层面上的差异,且可以将差异基因自定义为基因集存储和可视化。
CeleCloud自动注释与分析平台
传统的单细胞数据分析依赖Linux命令行工具,让熟悉界面操作系统的临床科研人员重新学习一个新的操作系统需要较高的时间和人力成本。SynEcoSys®内置了CeleCloud自动数据分析平台,从表达矩阵文件上传到细胞亚群注释,一步完成单细胞测序数据的关键分析步骤。CeleCloud对各项分析参数给出最佳推荐值,支持自定义调整,所有分析参数均可复现。
此外,CeleCloud配备了新格元独家自动注释算法,可通过单细胞转录相似性和经典细胞类型Marker基因表达两种方法对分群结果进行自动注释。自动注释算法已经过2000+单细胞的项目分析训练,注释结果准确可靠,注释细胞类型也更加全面。